主题相似度相关论文
随着大科学时代的到来,各学科的研究领域不断拓展,逐渐打破学科间传统的知识壁垒,导致不同的学科领域拥有共同的研究主题,而不同学......
对电子邮件文本进行过滤与分析能够有效的协助人们了解过去发生的重要事件信息与人员交互行为,电子邮件数据集中丰富的文本、图像......
处在信息时代,信息搜索成了人们生活不可缺少的部分,背后支撑的信息检索技术尤为重要。传统的信息检索模型通过匹配文档和查询中词......
搜索引擎的出现使人们获取信息的效率大大提高,怎样从海量的搜索结果中将用户最关心、最需要的信息排在返回列表的最前面,即搜索结......
在互联网广泛应用的影响下,特别是微信、微博、问答系统等新媒体的出现使得互联网每天产生海量的短文本信息。这些短文本的长度短......
作为信息化发展的重要产物,微博凭借其低门槛、实时性等特点迅速蹿红,使得广大网民在不同地点不同时间段内互动成为可能,并且在较......
关注政府改革,紧扣时代脉搏。为理解我国长期的政治改革与经济发展的特征,本文重点从政策面上研究两方面的问题。其一,治国方针在......
社交网络结构错综复杂,主题社区是进行个性化推荐和商业推广的重要途径之一。然而,现有主题社区挖掘方法,要么仅基于链接关系和文......
针对使用传统的用于本体排序的方法得到的排序结果不够准确的问题,提出了一种新的内容分析方法。首先通过构造本体的概念模型提取......
本文以知识单元的游离与组合的知识计量理论为基础,以时间加权修正后提取的关键词为知识单元,从而在关键词、关键词关联和主题关联......
如何从Web上获取感兴趣的资源是许多Web研究领域重要的研究内容.目前针对特定领域Web资源的获取,主要采用聚焦爬行策略.但目前的聚......
对电子邮件文本消息与收发关系的可视化,能够有效地分析过去发生的重要事件与人员交互.然而现有的电子邮件可视化软件对电子邮件主......
隧道穿越一直是主题网络蜘蛛爬行研究的难点,本文在分析了网页主题特征和普通隧道技术爬行算法缺点的基础上,提出了使用主题相似度指......
PageRank算法是最为经典的Web 结构挖掘算法,但是其存在主题漂移的问题,使得搜索结果中存在大量与查询主题无关的网页.在分析PageR......
针对因Web中存在由正常网页指向垃圾网页的链接,导致排序算法(Anti-TrustRank等)检测性能降低的问题,提出了一种主题相似度和链接权......
视频中的人体行为分析是计算机视觉领域的研究热点,视频分段是人体行为分析的基础。文中提出了基于主题相似度的视频分段方法,首先......
本文以知网数据库中管理工程和情报学共12本CSSCI期刊5年的论文作为数据,通过AT主题模型、相似度计算识别学科间交叉主题并对其相......
针对微博信息的交互性和不确定性,提出一种基于用户属性与覆盖范围的意见领袖研究方法。该方法分别计算用户属性值和用户传播覆盖......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
随着移动互联网的普及,数据产生的速度不断加快,数据量不断增长。搜索引擎提供的查询结果数量虽能够满足普通用户的需求,但不足以......
对传统专利文本自动分类方法中,使用向量空间模型文本表示方法存在的问题,提出一种基于LDA模型专利文本分类方法。该方法利用LDA主......
为了解决现有的多标签传播社区划分算法采用的随机顺序策略导致形成的社区划分结果不稳定和社区质量不够高的问题,提出了一种基于......
PageRank算法是著名搜索引擎Google的核心算法,但存在主题漂移的问题,致使搜索结果中存在过多与查询主题无关的网页.在分析PageRan......
期刊
近年来,LDA(Latent Dirichlet Allocation)主题模型通过挖掘文本的潜在语义主题进行文本表示,为短文本的相似度计算提供了新思路。......
篇章分析是自然语言处理领域的一个重要任务。分析篇章主次关系有助于理解篇章的结构和语义,并为自然语言处理的应用提供有力的支......